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Ефективний протокол для розподплених систем 


Разработан широковещательный протокол быстрой и надежной передачи данных. Логически он 
позволяет работать с кластером узлов как с одним объектом. Исследованы возможности его при- 
менения для повышения эффективности систем распределенной обработки данных. 
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Введение 


На сегодняшний день компьютерные сети получили многофункциональное ис- 
пользование. Одним из основных требований, предъявляемых к их работе, является 
быстрая и надежная передача информации. Особую важность приобретает это 
требование, если речь идет о широковещательном режиме работы. 

В современных компьютерных сетях существуют два типа технологий передачи: 

— широковещательные сети; 

— сети с передачей от узла к узлу. 

Широковещательные сети обладают единым каналом связи, совместно исполь- 
зуемым всеми узлами сети. 

Эти сети позволяют передавать данные одновременно всем узлам. Такая опе- 
рация называется широковещанием (Бгоа4саз®). 

Сети с передачей от узла к узлу состоят из большого количества пар соеди- 
ненных узлов. В таких сетях передача данных реализуется через промежуточные 
узлы. Операции в сетях и соответствующие им протоколы называются уникальными 
(ип1са5), хотя может существовать несколько возможных путей от источника до полу- 
чателя [1]. 
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Широковещательные протоколы, реализующие однократное дублирование 
информации в сети с возможностью множественного доступа к этой информации 
многими узлами сети, для пользователей имеют ряд привлекательных черт: 

— устраняется множественное дублирование информации, которое снижает 
скорость работы как всей сети, так и приложений, которые выполняются на многих 
узлах сети; 

— легче контролировать один направленный поток, чем множество потоков; 

— в случае групповой рассылки требуются дополнительные протоколы. 

Все это наводит на мысль использовать эти протоколы в системах распре- 
деленной обработки данных для повышения их эффективности [2], [3]. 

В распределенной обработке данных (РОД) в последнее время появляются новые 
концепции обработки и новые технологии. Среди них можно обозначить Сл14-системы и 
«облачные» технологии. 

Распределенные вычисления незаменимы, например, при переборных задачах: 
поиск простых чисел, молекул и их сочетаний при создании лекарственных веществ, 
обработка данных во многих сферах деятельности [4], [5]. Специфической особен- 
ностью РОД является налаживание интерфейса между различными обработчиками 
данных, географически удаленными друг от друга, и интегрирование результатов 
обработки. 

Две основные причины порождают необходимость использования РОД. Во- 
первых, природа приложения может требовать применения коммуникационной среды. 
Во-вторых, необходимость применения РОД может диктоваться экономическими со- 
ображениями. Кроме того, распределенные системы значительно проще масштабировать. 

В связи с этим была поставлена цель работы — создать широковещательный 
протокол, который бы быстро и надежно транспортировал данные в системах рас- 
пределенной обработки. 


Анализ протоколов передачи данных 


Был проанализирован ряд протоколов для изучения их возможностей и тех- 
нологий проектирования. Выявлены их достоинства и недостатки. Среди таких 
протоколов, в частности, были рассмотрены: 

— 1ОМР (Пете Отоир Мапазетеп{ Ргоюсо!), используемый при проведении 
видеоконференций, передаче звуковых сообщений, а также группового исполнения 
команд различными компьютерами; 

— ВТР (Тгапзрой Ргоюсо| юг Кеа! — Типе аррИсаНоп), предназначенный для 
доставки данных в реальном масштабе времени. Приложение обычно используют 
КТР поверх протокола ОПР, чтобы использовать его возможности мультиплек- 
сирования и контрольного суммирования. В принципе ВТР может использоваться и 
поверх любой другой транспортной среды [6]; 

— ВТСР (КТР Сопво! Ргоюсо!), базирующийся на периодической передаче 
управляющих пакетов всем участникам сессии, используя тот же механизм рассылки, 
что и для пакетов данных. Главная задача протокола — обеспечение обратной связи 
для контроля качества при рассылке данных; 

— КТЗР (Кеа| — Тите Зиеатту Ргоюсо]!) — двунаправленный протокол, обес- 
печивающий согласование эффективной доставки по ПР-сетям для приложений типа 
«один — многим». Архитектурно КТЗР расположен над КТР и КТСР; 

— В5УР (Везоигсе Кезегуаноп Зер Ргоюсо!) используется, чтобы запросить 
для приложения определенный уровень качества сетевых услуг ОоЗ вдоль всего 
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маршрута транспортировки данных, обеспечивая резервирование необходимых сетевых 
ресурсов. Механизм обеспечения Ооз включает в себя классификацию пакетов, ад- 
министративный контроль и диспетчеризацию; 

— ПОР (Озег Оааотат Ргоюсо]) проектировался для создания в объединенной 
системе компьютерных сетей с коммутацией пакетов режима передачи дейтаграмм 
клиента. ДОР предполагает, что нижестоящим протоколом является [Р. ОШР обеспе- 
чивает широковещательную рассылку данных ‚ но не надежен. Поэтому приложения, 
требующие гарантированного получения потоков данных, должны использовать 
протокол ТСР. 

Были исследованы и ряд других протоколов и на основе их разработан про- 
токол ОВТР (Ощтуегза|! Вгоа4саз{ Тгапзрог Ргоюсо!), обеспечивающий требуемое 
качество передачи информации. 


Концепция построения протокола ОВТР 


Предлагается создать на базе протоколов ТСР\!Р универсальный протокол для 
работы с группой хостов, как с логически одним объектом. Идея его создания 
основана на использовании обоих протоколов стека ТСР\Р ОПР и ТСР. Передача 
наиболее объемной информации ведется по каналу ОПР, а обработка ошибок пере- 
дачи и выполнение служебных задач реализуется на базе протокола ТСР. Будем 
называть этот протокол ОВТР (Отуегза! Вгоа4саз{ Тгапзрой Рго{осо]). 

В общем случае протокол ОВТР решает три основные задачи: 

— передача пакетов по протоколу ОПР в широковещательном (Вгоа4саз() режиме; 

— кэширование информации; 

— управление передачей пакетов. 

Реализация протокола ОВТР включает следующие компоненты: 

Вгоадса${ Зегуег — выполняет подключение и отключение клиентов от канала 
передачи данных в Вгоадсаз( режиме. Передача Втгоа4саз( потока, создание обработчика 
ошибок, восстановление последовательности данных после сбоя в Вгоа4саз{ потоке; 

Вгоадса${ СПеп: — выполняет подключение к Вгоа@саз( Зегуег и получение дан- 
ных из Вгоа4са${ потока ОПР или от обработчика ошибок сервера. 

Возможны две схемы взаимодействия клиента и сервера: 

— сервер и клиент обмениваются уведомлениями о начале и конце сессии; 

— клиент получает доступ к потоку данных и не уведомляет сервер о событиях, 
связанных с данными. 

Первая схема предпочтительна для тех приложений, где требуется достичь ка- 
чества передачи с коэффициентом потерь, равным нулю. Для мультимедийной инфор- 
мации предпочтительнее вторая схема взаимодействия [7]. 

Прием-передача ведется в промежуточные буфера непрерывно. Отметим, что 
протоколы реагируют на качество сетевых интерфейсов. Чем качественнее сеть, тем 
меньше памяти и ресурсов необходимо протоколу. По заполнению одного из буферов 
передача будет заблокирована до тех пор, пока приложение не заберет данные из 
буфера, поэтому следует правильно определять размеры приемных буферов, исходя 
из качества сети. 

Восстановление целостности данных после сбоя реализуется двумя принци- 
пиально разными схемами, которые могут использоваться совместно. В этих схемах 
имеется одно общее — передатчик не прекращает посылку ОШР пакетов до передачи 
всей подготовленной информации. Приемник же может вести себя по-разному. 
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Если приемник обнаружил потерю целого диапазона пакетов, он передает об- 
работчику ошибок передатчика номера пакетов этого диапазона, приостанавливая 
при этом передачу до получения потерянных пакетов по ТСР, после чего опять 
возобновляется прием по ОПР. Приемник, обнаружив потерю целого диапазона паке- 
тов, передает передатчику параметры этого диапазона, не прекращая прием. Прием- 
ник ведет таблицу потерянных пакетов из диапазона, которые восстанавливаются по 
мере параллельной передачи информации по ОПР и ТСР. Передатчик также ведет 
таблицу запросов на восстановление данных, и по мере нахождения потерянных 
данных в кэше передаёт их приемнику по ТСР, не прекращая вещание по ОШР. Пе- 
редатчик ведет таблицу качества связи с каждым хостом, участвующим в сеансе и 
может, в случае постоянных проблем, перевести хост на передачу по протоколу ТСР 
поток данных, дублируя их. 

Для синхронной работы многих хостов необходимо использовать первую схему. 
Вторая схема предпочтительна для систем распределенных вычислений, так как син- 
хронизация нужна только при инициализации распределенных вычислений, а 
информация должна распространяться в сети с максимальной скоростью. Общий 
принцип взаимодействия по протоколу ОВТР представлен на рис. 1. Схема реали- 
зации протокола приведена на рис. 2. 


Вгоаасая Беа 


Вгоаасая Баа 


Вгоаасая Реаа 


Р исунок 1- Общий принцип трансляции потока данных по сегментам сети 


Структура Вгоа@са${ Зегуег 


Вгоасаз{ Зегуег состоит из трех независимых блоков, работающих параллельно: 
— блок передачи информации по ОПР; 

— блок кэширования информации; 

— блок восстановления информации. 
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Рисунок 2 — Схема реализации протокола ОВТР 


Восстановление информации по ТСР ведется в 2 этапа: 

— поиск потерянного интервала информации в кэше; 

— передачи этого интервала клиенту по ТСР. 

Восстановление информации невозможно без наличия её копии, органи- 
зованной специальным образом. Эту копию в дальнейшем мы будем называть кэшем 
или таблицей истории информации. 

Кэш и таблица имеет кольцевую структуру. При достижении ее конца, таблица 
начинает перезаписывать себя с начала. Таким образом, имеется кольцо, в котором 
дублируется передаваемая информация за предопределённый интервал времени. Любую 
информацию за этот интервал времени, таким образом, можно восстановить. 

Интервал времени настраивается в процессе работы передатчика и зависит от 
качества сети. 

Если потери начинают возрастать, то интервал времени увеличивается, и нао- 
борот. Информация в кэше проиндексирована по времени передачи и хранится в 
заголовке кэша. 


«Штучний 1нтелект» 2013 №3 43 


25 Буза М.К. 


От алгоритма поиска информации в кэше зависит эффективность протокола. 
Поиск ведётся с использованием индексов, созданных на этапе построения кэша. 
Имея в запросе на восстановление информацию о самом раннем и о самом позднем 
пакете потерянного диапазона, методом дихотомии приближаемся к требуемому 
диапазону пакетов и отправляем их клиенту, иначе посылается признак ошибки 
(МО ПРАТА_1\ НАЗН). В этом случае клиент сам решает вопрос о продолжении 
участия в группе хостов. 


Функции Вгоа4са${ СПет 


Вгоаасаз{ СПепЕ выполняет 3 основные задачи: 

— прием информации по ОПР в системный буфер; 

— восстановление информации в случае сбоя; 

— проверку информации на непрерывность. 

Прием информации выполняется в системный буфер, где она записывается 
последовательно и непрерывно независимо от потери какого-либо интервала данных. 
Если при приеме обнаруживается разрыв, записывается точка разрыва данных. Напри- 
мер, если в системном буфере может быть записано (0х100[0х100], Ох0а0с100[0хЬ00]...), 
то при получении данных имеются 2 дыры по адресам 0х100, 0х0а0с100 с размерами 
[0х100] и [0хЬо0]. Прием информации по ОПР в системный буфер ведется непрерывно. 

Восстановление данных при сбое происходит параллельно с приемом первым 
сервисом информации и заполнении системного буфера информацией о дырах. 

Как только появилась дыра в данных, сервис отправляет на сервер запрос с 
указанием интервала и ждет ответ. 

В случае наличия данных на сервере, он принимает данные (по ТСР) и закрывает 
дыру, иначе помещает в системный буфер ошибку (МИМО РПАТА). И так далее 
до закрытия всех дыр. 

После получения последней порции информации от сервера происходит про- 
верка ее на целостность — просто проверяется отсутствие ошибки МИ$$ПМОа_ПАТА в 
буфере. 

При положительном исходе данные становятся доступными для дальнейшей 
обработки клиентом. 

Программная реализация протокола представляет собой две библиотеки — 
клиентскую и серверную. 

Они могут включаться в приложения как ПГТ, или [ЛВ компоненты. 

Проведенное тестирование скорости и качества передачи информации в сети 
показали, что в среднем из 200 Мбайт данных, переданных по ОПР, на долю про- 
токола ТСР приходится в среднем до 10 Мбайт при загрузке сети 50%. Результаты 
тестирования, полученные на сегменте Г. АМ 10Вазе-Т, приведены в табл. 1. 

Графа «Потери» не означает потерю информации. 

В соответствии с концепцией, это та доля информации, для передачи которой 
привлекается протокол ТСР. Большой процент передач по ТСР объясняется низкой 
пропускной способностью сегмента Е®егпее. 

Следует подчеркнуть, что при использовании разработанного протокола ско- 
рость работы со многими клиентами приблизилась к скорости работы системы с одним 


клиентом. 
Таблица 1 — Результаты тестирования протокола 
Объем, (Мбайт) Загрузка сети, (%) Потери, (Мбайт) | Количество клиентов 
200 10 2 10 
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200 50 7 10 
200 80 13 10 


Таблица 2 — Передача мультимедийных кадров 


з Протокол на основе ПОР ТСР 
Объем я 
о © 
Мбайт) - аа Количество кадров в | Количество кадров в г е 
м (м — т) секунду у каждого секунду у каждого О Е 
=. клиента клиента Е о 
- Е 
1.5 10 0.1 100 80 1 
|5 10 0.156 80 10 10 
1.5 50 0.2 60 10 10 
1.5 80 0.4 55 3 30 


Следующий тест, эмулирующий передачу мультимедийной информации кадрами 
фиксированного размера (1,5 Мбайт), демонстрирует преимущества данной концепции. 

Результаты теста приведены в табл. 2. 

В тесте сравнивается количество полученных кадров каждым пользователем в 
секунду при использовании данной концепции на базе основного протокола ПОШР с 
восстановлением потерянной информации с помощью протокола ТСР и передачей 
кадров с использованием только протокола ТСР. 


Выводы 


В работе рассмотрены основные требования к распределенной обработке. Про- 
анализированы многие протоколы, используемые в компьютерных сетях. На основе 
семейства протоколов ТСРЛР создан комбинированный широковещательный прото- 
кол ОВТР, позволяющий быстро и надежно передавать информацию. Апробирование 
разработанного протокола осуществлено в ряде экспериментов, которые подтвер- 
дили его достоинства. 
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